转换 概率 对 语音 统计 学 习 效应 的 独立 作用 
TXA) ERR E RAFE 
1. 南京 师范 大 学 文学 院 
2， 纽 约 州立 大 学 奥 尔 巴 尼 分 校 教育 学 院 
3. 中 国 科学 技术 大 学 语言 交叉 研究 中 心 
fü 要 : 实验 一 采用 2《〈 词 长 : 两 音节 ， 三 音节 ) X3( 迫 选 对 类 型 : 目标 词 和 跨 界 词 ， 目 标 
词 和 非 词 ， 跨 界 词 和 非 词 ) 的 被 试 内 设计 , 发 现 三 音节 跨 界 词 和 非 词 迫 选 对 中 的 正确 率 显 著 
高 于 两 音节 相应 迫 选 对 , 在 三 音节 目标 词 和 跨 界 词 迫 选 对 中 的 正确 率 边 缘 显 著 低 于 两 音节 相 
应 迫 选 对 。 区 别 于 实验 一 以 音节 组 合成 词 再 合成 人 工 语言 , 实验 二 直接 以 音节 为 单位 拼接 人 
工 语言 ， 迫 选任 务 中 的 试 次 和 实验 一 完全 一 致 ， 发 现 被 试 未 产生 学 习 效应 。 由 于 实验 一 中 对 
比 情况 仅 有 转换 概率 的 区 别 , 而 实验 二 排除 了 音节 组 合 偏好 的 干扰 ,因此 本 研究 证 明了 转换 
概率 在 统计 学 习 中 的 独立 作用 。 
关键 词 ， 转 换 概率 ， 词 频 ， 统 计 学 习 ， 人 迫 选 任务 
1 引言 
统计 学 习 指 个 体能 够 从 外 界 输入 的 时 间 信 息 和 空间 信息 中 发 现 统计 信息 并 以 此 信息 当 
习 新 事物 的 过 程 CSaffran et al., 1996; Frost et al., 2020; 于 文 勃 等 ，2021a，2021b)， 统 计 学 


习 被 认为 是 人 类 的 一 项 重要 认 知 能 力 ， 和 口语 词 切 分 、 词 汇 语 义 习 得 等 方面 都 有 较 强 的 联系 


4k 


k 


( Estes et al., 2007, 2015; Newport, 2016; Raviv & Arnon, 2018; Saffran & Kirkham, 2018; 


Bogaerts et al., 2020; Siegelman, 20200. 虽然 统计 学 习 机 制 在 不 同 模 态 下 都 有 一 定 的 表现 , 但 


在 语音 模 态 下 的 研究 最 为 充分 (Mirman et al., 2008; Wang & Saffran, 2014; Gómez et al., 2017). 


由 前 向 后 的 转换 概率 (transitional probability, TP) 是 统计 学 习 中 核心 的 概率 信息 之 一 ， 其 计 
算 公式 为 ; 


TP x NY) 


-frequencyxy [frequency 
研究 者 假设 人 类 大 脑 可 以 追踪 音节 间 的 转换 关系 ， 对 高 转换 概率 的 音节 组 合 记 忆 表 征 
更 加 牢固 ,达到 学 习 的 目的 。 在 编制 实验 材料 过 程 中 ,目标 词 会 按照 一 定 的 规律 进行 伪 随 机 
拼接 ， 并 作为 一 个 整体 出 现 ， 它们 内 部 相连 音节 的 转换 概率 较 高 ， 如 在 图 1 中 ， 每 个 字母 代 
表 一 个 音节 , 目标 词 ABC 内 部 AB 和 BC 的 转换 概率 为 1, 而 两 个 目标 词 间 前 后 连接 的 音节 


组 合 被 称 作 跨 界 词 ， 由 于 目标 词 ABC 后 会 随机 出 现 其 他 目标 词 下 L、GHI 或 DEF， 跨 界 词 
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CJK 中 前 两 个 音节 的 转换 概率 为 13， 那 么 跨 界 词 作为 一 个 整体 的 转换 概率 (0.670 (KFA 
标 词 。 在 学 习 阶 段 后 ， 对 被 试 的 学 习 效果 进行 测试 ， 如 果 被 试 能 够 区 分 目标 词 和 跨 界 词 或 非 
词 〈 非 词 由 不 同 目标 词 的 音节 拼接 而 成 ， 内 部 转换 概率 和 词 频 均 为 0)， 那 么 就 认为 出 现 了 


学 习 效应 。 


-ABC-JKL-ABC- GHI-DEF-JKL- 


[IY 


目标 词 ” 跨 界 词 跨 界 词 。 目标 词 

TP=1 TP= (03341) /2 TP= (140.33) /2 TP=1 

图 1 语音 统计 学 习 材 料 示意 图 

来 自 婴 幼儿 、 成 人 和 二 语 学 习 者 的 实验 都 验证 了 统计 学 习 机 制 的 假设 CSaffran et al., 


1996; Erickson, Thiessen, & Estes, 2014; Estes et al., 2015; Estes & Lew-Williams, 2015; Potter, 
Wang, & Saffran, 2017)， 但 很 少 提 及 个 体 是 不 是 只 依靠 转换 概率 进行 切 分 和 学 习 的 。 如 上 图 
所 示 ， 虽 然 跨 界 词 〈 如 CJK) 的 转换 概率 低 于 目标 词 ( 如 ABC), 但 是 它们 在 人 工 语言 中 出 
现 的 频次 也 更 高 , 假设 使 用 4 个 无 意义 三 音节 目标 词 合 成 人 工 语言 , 目标 词 间 拼接 处 所 形成 
的 跨 界 词 转换 概率 为 0.33， 那 么 当 每 个 目标 词 出 现 100 次 时 ， 跨 界 词 CCIK, HID) 在 人 工 
语言 中 出 现 的 次 数 为 100X0.33=33， 也 就 是 说 目标 词 和 跨 界 词 在 转换 概率 和 词 频 两 个 概率 
信息 上 都 有 明显 的 区 别 , 转换 概率 和 词 频 的 复杂 关系 导致 我 们 无 法 给 出 转换 概率 是 否 能 够 独 
立 影 响 统计 学 习 效 应 的 证 据 。 

一 些 研究 试图 在 分 离 词 频 因素 后 考察 转换 概率 对 学 习 效应 的 影响 (Aslin et al., 1998 ; 
Estes, 2012)。 在 婴 幼 儿 实验 中 ， 研 究 者 通常 是 在 拼接 人 工 语言 过 程 中 将 一 半 的 目标 词 呈 现 
次 数 减 半 , 随后 在 转 头 偏好 任务 中 , 仅 将 高 频 目 标 词组 合成 的 跨 界 词 和 低频 目标 词 作为 测试 
材料 ， 由 于 它们 在 人 工 语言 中 的 词 频 相 同 ， 因 此 如 果 婴 儿 表 现 出 去 习惯 化 效应 ， 那 么 就 可 以 
证 明 个 体 只 依靠 转换 概率 就 可 以 完成 统计 学 习 任 务 。 此 外 ，Endress 和 Langus (2016) 通过 
对 比 多 个 实验 的 结果 发 现 转换 概率 在 影响 统计 学 习 的 效应 应 该 大 于 频次 。 然而, 为 数 不 多 的 
研究 仍旧 存在 一 些 不 足 之 处 。 首先 , 大 多 数 研究 在 拼接 人 工 语言 时 都 采用 相等 长 度 的 目标 词 
(两 音节 或 三 音节 )， 这 一 方面 并 不 符合 自然 语言 词 长 不 等 的 情况 (Frost et al, 2020), mH. 
会 导致 在 学 习 阶 段 初期 被 试 就 产生 节奏 期 待 , 很 容易 就 发 现 所 有 词语 都 是 相等 长 度 的 ， 从 而 
夸大 学 习 效应 (Hoch etal., 2013 )。 其 次 ， 由 等 长 度 目标 词 合成 的 人 工 语言 大 大 限制 了 测试 
词语 转换 概率 的 变化 范围 。 以 由 4 个 三 音节 目标 词 合 成 人 工 语言 为 例 , 所 有 跨 界 词 的 转换 概 


率 为 0.67((1+0.33)/2), Evi] Ped ES 7 1, TEA 
比 情况 ; 然而 ， 如 果 转 换 概率 有 


种 对 
词 两 两 组 成 迫 选 对 


最 后 


加 填充 词语 来 降低 词语 的 转换 概率 , 从 而 保证 选项 在 词 频 信 ， 


实 可 以 独立 影响 学 习 效 应 ， 忆 


FE 务 〈 转 头 偏好 任务 ) 中 


只 能 考察 这 一 


EA dE Bb. PERDE 


,被 试 的 迫 选 正 确 率 会 有 所 不 同 ,但 目前 还 没有 见 到 这 方 站 
» PMH (2021b) 采用 组 间 设 计 的 方法 考察 转换 概率 的 独立 效应 ， 在 实验 中 通过 增 
电 上 没有 区 别 ， 而 仅 在 转换 概率 


的 实证 研究 。 


上 有 所 不 同 。 虽然 在 成 人 实验 中 发 现 转 换 概率 的 提高 能 够 促进 统计 学 习 效 应 , 但 是 这 一 研究 


中 高 低 转换 概率 是 组 间 变 量 , 高 转换 概率 条 件 下 的 学 习 时 间 较 短 , 低 转 换 概率 条 件 下 由 于 
加 了 填充 词 而 导致 学 习 时 间 较 长 ， 该 条 件 的 目 
因 也 不 唯 


所 以 学 习 效应 较 低 的 解释 原 


标 词 在 记忆 系统 


受到 了 更 多 的 干扰 和 抑 人 
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究 通 过 设计 混合 长 度 的 目 


标 词语 来 解决 以 上 问题 。 首 先 ， 我 们 采 


节目 标 词 拼接 成 混合 长 度 的 全 


非 词 , 


非 词 迫 选 对 ， 跨 界 词 和 非 词 迫 选 对 )。 保 证 每 一 个 迫 选 试 次 
局 好 双 音 节 结 构 〈 于 文 勃 等 ， 


通话 母语 者 存在 韵律 期 


Ei 


, 1 


[语言 ,在 迫 选 人 有 


竺 相同 长 度 前 提 下 两 两 配对 形成 三 种 迫 选 对 类 型 (目标 词 和 


FE 务 中 分 别 设置 两 种 长 度 的 目 


两 音节 和 三 音 
标 词 、 跨 界 词 和 
MARAE, 目标 词 和 


2021b; 


们 重点 对 比 被 试 在 不 同 长 度 条 件 下 相应 人 迫 选 对 的 正确 


率 , 这 是 因 


两 个 选 


项 长 度 相 同 的 原因 是 普 


裴 雨 来 ，2016)。 其 次 ， 我 


为 在 两 音节 的 目标 词 和 跨 界 


词 迫 选 对 中 , 两 个 选项 在 词 频 和 转换 概率 上 都 有 差异 , 但 是 词 频 的 差异 在 三 音节 的 概率 迫 选 


对 中 仍旧 存在 , K 


此 当 我 们 再 比较 同类 迫 选 对 在 不 同 长 度 下 的 了 


转换 概率 的 独立 效应 〈 六 类 1 
验 都 是 被 试 内 设计 , 被 试 完成 的 学 习 任 务 时 间 相同 , 不 会 


提 选 选项 的 词 频 和 转换 概率 详 见 表 1)。 最 后 
因为 学 习 时 间 长 短 不 同 带 来 额外 变 


E 确 率 差 异 时 ， 就 可 以 分 离 出 


LI 


， 本 研究 的 两 个 实 


量 。 在 实验 一 中 , 我 们 以 目 


bri 
但 菜 些 音节 组 合 可 能 在 普通 话 背景 


实验 效应 。, 所 以 实验 二 直接 以 音节 为 单位 、 采 


人 迫 选 任务 中 使 用 


被 试 


和 实验 一 完全 一 致 的 材料 , 如 果 在 实验 二 
的 学 习 效 应 , 则 证 明 这 一 效应 是 来 自 了 
更 加 熟悉 ， 相反 ， 如 果 没 有 任何 学 习 效应 ， 则 说 明 在 缺失 以 词 为 单位 的 概率 关系 后 ， 


试 无 法 分 辨 几 类 词 ， 进 一 步 证 明了 实验 一 中 实验 效应 是 来 自 于 对 概率 关系 的 加 工 。 


司 为 单位 合成 人 工 语言 , 虽然 人 工 语言 都 是 由 无 意义 音节 组 成 ， 
下 更 加 受 欢迎 、 被 试 更 熟悉 ， 这 一 特定 偏好 ! 可 能 会 混淆 


相同 的 规则 合成 人 工 语言 (Toro et al., 2011), 


， 被 试 仍旧 表现 出 类 似 于 实验 一 


F 我 们 所 设计 的 目标 词 和 跨 界 词 更 加 符合 普通 话 的 特点 、 


2 实验 一 : 转换 概率 对 统计 学 习 效 应 的 独立 作用 


2.1 方法 


! 发 表 在 外 文 其 


被 


刊 的 文章 中 ， 会 以 “arbitrary listening preferences” =k “general preferences for certain syllable 


strings” 来 指 代 本 文 的 “特定 偏好 ” 这 一 现象 和 被 试 的 语言 经 验 有 关 ， 但 包括 范围 更 广 。 
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2.1.1 被 试 
共有 40 名 被 试 参与 实验 ， 男 性 被 试 15 名 ， 被 试 年 龄 范围 19 一 25 岁 ， 所 有 被 试 母语 均 


为 汉语 普通 话 。 实 验 要 求 被 试 学 习 没 有 接触 过 的 人 工 语言 ,为 了 排除 被 试 二 语 经 验 、 音 乐 经 
验 对 实验 结果 的 影响 ， 所 有 被 试 均 非 外 国语 专业 和 音乐 相关 专业 ; 最 后 , 为 了 避免 被 试 猜测 
实验 目的 ， 排 除了 心理 学 专业 学 生 。 实 验 前 ， 被 试 签署 知情 同意 书 ， 实 验 结束 后 被 试 获取 少 
量 报酬 ， 本 研究 经 过 校 伦 理 委员 会 审查 〈X X X 2022060023). 
2.1.2 实验 设计 

采用 学 习 -测试 范式 考察 被 试 的 语音 统计 学 习 能 力 ， 实 验 设计 为 2〈 词 长 : 两 音节 ， 三 
TRA) X3《〈 迫 选 对 类 型 : 目标 词 和 跨 界 词 迫 选 对 ， 目 标 词 和 非 词 迫 选 对 ， 跨 界 词 和 非 词 迫 
选 对 ) 的 被 试 内 设计 。 在 具体 的 分 析 中 , 首先 检验 被 试 在 迫 选 对 上 的 正确 率 与 随机 水 平 0.5) 
的 差异 性 ， 随 后 进行 方差 分 析 检 验 转 换 概率 的 独立 效应 。 本 实验 的 材料 、 数 据 和 代码 已 上 传 
至 github: https://github.com/wenboyu0803/independent-effect-of-TP 。 


2.1.3 材料 和 实验 程序 
在 学 习 阶 段 ,由 10 个 音节 构造 目标 词 来 合成 人 工 语 言 ,所 有 音节 均 来 自 于 文 勃 等 (2021b) 


的 研究 ， 由 一 名 女性 普通 话 母 语 者 录制 ， 经 过 标准 化 后 音节 时 长 300ms， 强 度 704B， 基 频 
266Hz。 参 考 以 往 研 究 设 计 ， 这 些 音节 在 普通 话 下 发 音 合理 ， 而 且 在 第 一 声 声调 下 无 意义 ， 


随后 将 10 个 音节 ?随机 组 成 4 个 目标 词 (Gomez et al., 2017; 于 文 勃 等 ，2021b)， 音 节 和 音 


节 之 间 没 有 任何 时 间 间 隔 。 根 据 以 往 统计 学 习 实 验 的 要 求 〈Saffran et al., 1996)， 按 照 伪 随 
机 的 方式 拼接 人 工 语言 , 其 中 每 个 目标 词 后 不 能 立刻 出 现 该 目标 词 ， 并 且 出 现 其 他 目标 词 的 
概率 相同 (本 研究 中 为 13 )， 在 人 工 语言 中 每 个 目标 词 出 现 100 次 , 保证 人 工 语言 前 后 两 段 
目标 词 均匀 分 布 ， 人 工 语言 时 长 5 分 钟 。 随 后 ,分 别 合成 跨 界 词 和 非 词 各 4 个 ， 前 者 要 求 目 
标 词 包括 前 后 相连 两 个 目标 词 的 部 分 音节 , 具有 一 定 的 转换 概率 , 后 者 要 求 词 内 音节 不 会 相 
连 出 现在 人 工 语言 中 ， 因 此 转换 概率 为 0。 编 制 迫 选 对 过 程 中 ， 为 了 保证 每 一 个 迫 选 试 次 内 
的 选项 仅 在 转换 概率 上 存在 差异 , 因此 每 个 迫 选 对 均 是 由 相同 长 度 的 选项 构成 , 同时 还 要 将 
两 个 选项 调换 顺序 呈现 两 次 ， 以 排除 选项 顺序 对 实验 结果 的 影响 。 迫 选 对 中 的 六 类 词 的 转换 


概率 、 在 人 工 语言 中 的 频次 如 表 1。 
表 1 实验 中 六 类 选项 的 转换 概率 和 频次 
词类 i 词 频 转换 概率 


两 音节 目标 词 remei, rouse 100 1 


ym 


2 在 印 欧 语系 下 ， 统 计 学 习 要 求 音节 组 成 的 目标 词 无 意义 ， 但 汉语 背景 下 音节 对 应 汉字 ， 因 此 要 保证 每 个 
节 都 无 意义 ; 同时， 有 研究 指出 被 试 会 分 别 对 音 段 结构 和 超 音 段 结构 进行 追 足 ， 所 以 普通 话 背 景 下 往往 
定 声调 。 结 合 以 上 两 点 ， 符 合 实验 要 求 的 音节 并 不 多 ， 在 20 个 左右 。 
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ama 


两 音节 跨 界 词 meirou, sere 33 0.33 

两 音节 非 词 refo, rouruo 0 0 

三 音节 目标 词 nueruote，diafolai 100 1 

三 音节 跨 界 词 tediafo, lainueruo 33 0.67 

三 音节 非 词 nuemeilai, diasete 0 0 

实验 程序 由 E-prime3 呈现 ， 被 试 佩戴 耳机 完成 ， 电 脑 音量 由 被 试 自主 调节 ， 在 30%~ 
40% 范 围 内 ,实验 程序 包括 练习 实验 和 正式 实验 , 练习 实验 前 由 主 试 讲解 实验 要 求 和 指导 语 ， 


并 播放 Ss 中 的 人 了 


[语言 ， 随 后 呈现 


LI 


料 在 正式 实验 


不 会 


现 。 


LI 


3 个 人 迫 选 试 次 帮助 被 试 了 解 实 验 流程 ， 练 习 实 验 


的 材 


正式 实验 被 试 需要 学 习 人 工 语 言 5 分 钟 ， 随 后 完成 24 个 迫 选 试 


次 ， 每 个 迫 选 试 次 


个 选项 仍旧 


» P 


后 ， 屏 幕 呈 现 提 示 语 ， 要 求 被 试 从 听 到 上 
键 进行 选择 。 实 验 全 程 大 约 需 要 10 分 钟 ， 流 各 


测试 阶段 


2. 2 结果 


2 33479 


目标 词 和 跨 界 词 迫 选 对 


图 2 实验 流入 


I- 2— fru] 
if 


S. 


ES 


j 音 频 的 方式 播放 ， 中 间 间 隔 S00ms, 
的 两 个 词语 中 选择 


全 部 播放 结束 


更 为 熟悉 的 那个 ， 按 “1” 或 “2” 
如 图 2。 


[ ...-ABC-DE-GH-JKL-ABC-JKL-DE-ABC-DE-... 


你 觉得 哪个 词 更 熟悉 ? 


时 


EAN 


觉得 哪个 词 更 熟悉 ? 
C 1: fi 


2: Fai 
目标 词 和 非 词 迫 选 对 


觉得 哪个 词 更 熟悉 ? 
C LBP 


2: mo 
跨 界 词 和 非 词 迫 选 对 


L1 


示意 图 


2.2.1 混合 词 长 条 件 下 的 统计 学 习 效 应 


在 统计 学 习 研 究 


, 


计 学 习 ， 跨 界 词 和 非 词 都 不 是 被 
它们 都 是 错误 答案 ; 不 过 , 在 跨 界 词 和 非 词 迫 选 对 中 ， 由 于 跨 界 词 上 
语言 中 出 现 了 一 定 的 次 数 , 因此 如 果 相 比 了 


进行 了 统计 学 习 。 


本 


on 


差异 的 95%CI:: [-0.00, 0.14], d=0.31, ZEA drial MAP ia M, iBXtIE HAE Se ey T 


随机 水 了 


跨 界 词 和 非 词 迫 选 对 


首先 通过 迫 


££, 


和 率 和 随机 水 平 的 比较 来 判断 被 试 是 否 实现 了 统 


IEH 


究 的 数据 分 析 使 用 R (4.3.10 语言 完成 。 单 样本 T 检 验 结果 表明 ,被 试 在 目 
跨 界 词 迫 选 对 中 ， 迫 


选 正 确 率 边缘 显 


F, t (39) 2453, p <0.001，M=0.63， 差 异 的 95%CI: [0.07，0.19]，4=0.72， 在 


式 所 要 


学 习 的 人 工 词 语 , EAE 的 前 两 种 迫 选 对 类 型 中 
的 转换 概率 更 高 且 在 人 工 
多 地 选择 跨 界 词 , 则 也 说 明 被 试 
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FE CUBE UP S 


标 词 和 


> t (39) 2197, p=0.056, M=0.57, 


区 


六 随机 水 3 


著 高 了 


££, 


， 迫 选 正 确 率 边缘 显著 高 于 随机 水 平 , ¢ (39) = 1.86, p=0.070, M= 


0.55, FEM 95%CI: [0.00, 0.10], d = 0.23 。 被 试 的 总 体 正 确 率 显著 高 于 随机 水 
从 效应 量 和 置信 


=3.71, p<0.001, M=0.55, ARN 95%CI: [0.04,0.13], d = 0.59. 


ed 
cem 
EE 


统计 学 习 效 应 ， 如 图 3。 


看 ,被 试 在 学 习 过 程 中 已经 能 够 对 有 转换 概率 的 结构 (目标 词 和 跨 界 词 ) 进行 记忆 表征 ， 


F, t (39) 
[X |R] 2 


表 


0.004 e 


1.004 
0.75- 

At 

i£ 0.504 

H 
0.254 


目标 词 ERA 目标 词 JEA 跨 界 词 非 词 


图 3 混合 词 长 条 件 下 的 统计 学 习 效应 
2. 2. 2 转换 概率 对 学 re 的 影响 


所 有 迫 选 


两 因素 被 试 内 方差 分 析 3 显 示 ， 和 迫 选 对 类 型 主 效应 边缘 显著 (FOC1.75, 68.13) =3.15, 


p=0.056，n ?=0.02)， 词 长 主 效应 不 显著 CF (1，39) =1.39, p= 


0.245), 


迫 选 对 类 型 和 


词 长 交互 作用 显著 CF (1.83, 71.31) =4.80, p=0.013, n2,2 0.03)。 对 迫 选 对 词类 的 主 效 


应 事后 检验 表明 , 被 试 在 目标 词 和 非 词 的 迫 选 对 上 的 正确 率 显 著 高 于 跨 界 词 和 非 词 (1 (39) = 


2.68, p = 0.032)。 两 个 因素 交互 作用 的 简单 效应 分 析 表 明 ， 在 目标 词 和 跨 
两 音节 条 件 下 的 正确 率 边 缘 显 著 高 于 三 音节 条 件 (1 (39)= 1.71，p = 0.095)， 但 在 跨 


非 词 条 件 下 ， 两 音节 条 件 下 的 正确 率 显 著 低 于 三 音节 条 件 (1 (39)= -2.60, p=0.013), ÆH 


压 界 词 迫 选 对 中 ， 


界 词 和 


标 词 和 非 词 迫 选 对 中 ， 词 长 的 简单 效应 不 显著 (1 (39) =-1.35, p=0.185)。 此 外 ， 在 两 音节 


词 长 条 件 下 ,目标 词 和 跨 界 词 迫 选 对 (1 (39) =2.34, p= 0.0032 以 及 月 


(39) = 2.52，p = 0.048) 的 正确 率 都 (边缘 ) 显著 高 于 跨 界 词 和 非 词 迫 


HEX. A 


;针对 实验 一 ， 我 们 也 使 用 了 逻辑 回归 的 线性 混合 模型 进行 检验 ， 将 试 次 和 被 试 作为 随机 截 距 ， 发 现 了 } 


著 的 固定 效应 : 相 比 于 两 音节 的 目标 词 和 跨 界 词 迫 选 对 ， 被 试 在 完成 三 音 


Yr He 
E 三 音节 条 


标 词 和 非 词 迫 选 对 Cr 


Ei 
MEL 


i 


断 的 可 能 为 前 者 的 0.90 倍 ， 和 方差 分 析 的 交互 作用 结果 一 致 。 由 于 统计 学 习 领 域 更 喜欢 通过 组 别 的 均值 判 


断 是 否 出 现 了 学 习 效应 ， 因 此 本 文 仍 以 工 检验 和 方差 分 析 结 果 为 主 ， 相关 代码 
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FL github. 


下 ,， 仅 有 目标 词 和 跨 界 词 迫 选 对 的 正确 率 显 著 低 于 目 
他 条 件 差 异 未 达到 显著 水 了 
。 被 试 在 六 


0.029 )， 


用 


Ee 


均 采 


了 bonferroni 矫正 


M 
实验 一 

SD 

M 
实验 二 

SD 


值得 注意 的 是 , 被 试 在 三 


目标 词 和 跨 界 词 
音节 三 音节 
0.61 0.53 
0.27 0.28 
0.55 0.49 
0.26 0.22 


标 词 和 非 词 迫 选 对 (1 (39) = -2.72, p= 


FE， 以 上 分 析 中 , 涉及 到 三 个 及 三 个 水 平 以 上 的 检验 时 ， 
' 迫 选 对 下 的 正确 率 和 标准 差 如 表 2 和 
表 2 三 类 迫 选 对 的 正确 率 和 标准 差 


图 4。 


目标 词 和 非 词 跨 界 词 和 非 词 
两 音节 三 音节 音节 BW 
0.60 0.66 0.49 0.61 
0.23 0.24 0.20 0.23 
0.41 0.52 0.49 0.43 
0.27 0.22 0.23 0.24 


章节 目标 词 和 跨 界 词 迫 选 对 和 两 音节 跨 界 词 和 非 词 迫 选 对 上 的 


正确 率 均 与 随机 水 平 差异 不 显著 , t (39) =0.57, M=0.53, p=0.570, t (39) = -0.40，M = 
0.49, p = 0.689， 这 两 个 结果 说 明 被 试 在 这 两 类 迫 选 对 上 没有 表现 出 学 习 效 应 。 
目标 词 跨 界 词 目标 词 非 词 跨 界 词 非 词 

0.9- 
Š [3 

0.3- 

0.0 4 e. LJ e e 

两 音节 三 音节 两 音节 三 音节 两 音节 -éns 
图 4 转换 概率 对 学 习 效应 的 影响 

2. 3 实验 一 讨论 

在 目标 词 和 跨 界 词 以 及 跨 界 词 和 非 词组 成 的 迫 选 对 中 ， 被 试 的 迫 选 正确 率 均 在 0.55 上 
下 ， 和 随机 水 平 差异 边缘 显著 ; 但 被 试 在 目标 词 和 非 词 的 迫 选 对 中 ,被 试 的 迫 选 正确 率 达到 


0.63， 显 著 高 于 随机 水 平 。 
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在 重复 测量 方差 分 析 中 ,我们 发 现 被 试 在 三 类 迫 选 对 正确 


率 差 异 


边缘 显著 , 尤其 是 目标 词 和 非 词 的 迫 选 对 中 了 
原因 ， 目 标 词 、 跨 界 词 和 非 词 三 类 词 在 学 习 材料 中 上 


E 确 率 显 背 高 于 路 界 词 和 非 词 的 迫 选 对 。 分 析 左 
H 现 的 频次 和 转换 概率 逐渐 下 降 ， 从 统计 


学 习 的 记忆 模型 来 看 (Thiessen & Erik, 2017; Isbilen et al., 2020; 2022; Lukics & Lukacs, 2021), 


高 转换 概率 的 结构 也 就 是 目 
行 表征 ; 而 跨 界 词 在 人 工 i 
征 相 对 较 弱 ; 最 后 ， 非 词 # 
最 低 ， 这 些 原因 共同 导致 了 被 试 在 不 同类 型 


标 词 , 在 人 工 语言 


出 现 频次 更 多 , 被 试 有 更 多 的 机 会 对 它们 进 
岗 频 次 较 低 ， 转 换 概率 也 相对 较 低 ， 被 试 对 它们 的 记忆 表 
， 因 此 被 试 对 它们 的 熟悉 度 或 再 认可 能 性 都 
! 迫 选 对 的 正确 率 存在 一 定 的 差异 。 

相 比 于 以 往 研 究 ， 实 验 一 在 实验 材料 上 进行 了 改进 ， 
转换 概率 并 不 相同 (两 音节 :; 0.33, 


两 音节 跨 界 词 和 三 音节 跨 界 词 的 


0.67)， 但 它们 在 人 工 语言 中 出 现 的 频次 相同 。 


当 它 们 分 别 和 长 度 相同 的 目 
] 再 比较 两 种 长 度 迫 选 试 次 的 正确 
两 音节 跨 界 词 的 转换 概率 较 低 ,它们 对 两 音节 目 


" 


出 两 音节 目标 词 , 因此 两 音节 目 
界 词 的 迫 选 对 。 同 理 ， 
在 和 非 词 〈 转 换 概率 为 0， 词 频 也 为 0) 3t 


二， 虽然 在 转换 概率 和 词 频 上 都 有 差别 , 但 是 当 我 


只 在 转换 概率 上 存在 差异 。 相 比 于 三 音节 人 迫 选 对 ， 
标 词 造成 的 干扰 较 小 , 被 试 可 以 轻松 地 选择 


EW 


oy ie RES Fe 38 E AY 
音节 跨 界 词 转换 概率 较 低 ， 三 音节 跨 界 词 转换 概率 较 高 ， 因 此 后 者 
了 配对 时 ， 被 试 较 容易 进行 选择 出 正确 答案 ， 最 


终 导致 三 音节 跨 界 词 和 非 词 迫 选 正确 率 显著 


一 步 说 明 当 词 频 差 异 


如 果 被 试 是 因为 对 我 们 随机 组 合 的 目 
旧 表 现 出 明显 的 “学 习 效 应 ” 相反 ， 迫 选 的 正确 率 和 


率 边缘 显著 高 于 三 音节 目标 词 和 跨 


高 于 两 音节 条 件 。 因此, 实验 一 交互 作用 结果 进 
固定 时 ， 转 换 概率 能 够 影响 学 习 效应 。 
在 实验 二 中 ， 我 们 直接 以 音节 为 单位 合成 人 工 语言 ， 


采用 相同 的 迫 选 材料 进行 实验 。 


标 词 和 跨 界 词 有 全 


3 实验 二 : 随机 人 工 语言 的 学 习 效应 检验 


3.1 方法 
3.1.1 被 试 


招募 被 试 的 标准 同 实验 一 ， 


随机 水 平 (0.5) 差异 不 显著 。 


< 有 另外 38 名 被 试 参与 实验 二 ， 其 中 男性 被 试 10 名 , 被 试 


年 龄 范围 为 19 一 26 岁 。 由 于 实验 程序 问题 ， 一 名 被 试 的 数据 被 覆盖 ， 最 终 有 37 名 被 试 的 行 


为 数据 进入 分 析 。 


3.1.2 实验 设计 、 材 料 和 程序 
仍旧 采用 学 习 -测试 进行 实验 ， 实 验 自 变 量 和 因 


变量 同 实验 一 保持 一 致 。 学 习 阶 段 的 人 


工 语言 以 实验 一 中 的 10 个 无 意义 音节 为 单位 合成 ， 每 个 音节 后 不 能 重复 出 现 该 音节 ， 可 以 


是 其 他 9 个 音节 中 的 任意 


工 语言 由 1000 个 音节 拼接 而 成 。 实 验 二 的 迫 选 试 


次 和 实验 一 完全 一 致 ， 经 过 计算 所 有 选项 在 人 


语言 出 现 频次 不 超过 


20 次 ， 所 占 比 例 非 常 


低 。 实 验 程序 同样 由 E-prime3 呈现 ， 包 括 练习 实验 和 正式 实验 ， 程 序 细节 和 实验 一 一 致 ， 


实验 持续 时 间 约 10 分 钟 。 


3.2 结果 


单 样本 检验 结果 显示 ,被 试 在 所 有 试 次 上 的 迫 选 正确 


--1.59, M=0.48, p=0.121,; 此 外 ， 被 试 在 目 


率 未 显著 高 于 随机 水 平 ,1 (36) 


标 词 和 跨 界 词 迫 选 对 


， 迫 选 正 确 率 未 显著 


高 于 随机 水 平 ，! (36) = 0.61，M= 0.53，P = 0.349， 在 目标 词 和 非 词 迫 选 对 中 ， 迫 选 正确 
率 未 显著 高 于 随机 水 平 ，! (36) =-1.23, M=0.46, = 0.226， 在 跨 界 词 和 非 词 迫 选 对 中 ， 


率 未 显著 高 卫 


迫 选 正确 


随机 水 平 ，! (360 =-1.54, M=0.53, p=0.133. 。 随 后 ， 结 合 词 长 变 


量 检验 被 试 在 六 种 条 件 下 是 否 表现 出 明显 的 学 习 效应 , 结果 发 现 被 试 的 迫 选 正确 率 均 未 显著 
.05)， 正 确 率 和 标准 差 如 表 2. 


高 于 随机 水 平 (p.s. >0 
3.3 实验 二 讨论 

实验 二 以 音节 为 单 
正确 


位 合成 人 工 语言 作为 学 习 材 料 , 考察 缺失 概率 信息 时 被 试 是 否 对 实验 


的 “答案 ”仍旧 表现 出 更 高 的 熟悉 性 ， 结 果 发 现 无 论 在 总 体 还 是 六 


水 平 下 被 试 的 迫 选 


率 均 未 显著 高 于 随机 水 平 , 这 说 明 实 验 一 


词 的 特定 偏好 ， 而 就 是 
4 总 讨论 


DERI SE IR 


来 


Zu 


多 


于 学 习 阶 段 对 转换 概率 信息 的 追踪 和 加 了 


,注重 检验 个 体能 否 依靠 统计 信 


的 学 习 效应 不 是 来 自 


于 被 试 对 目标 词 、 跨 界 


息 实 现 统 


关注 个 体 对 哪些 统计 信 


息 进行 了 利用 。 本 


FHI H 


的 学 习 效 应 ， 从 而 验证 其 对 统计 学 习 效应 的 独立 贡献 。 实 验 一 中 , 我 


标 词 、 跨 界 词 和 非 词 , 结果 发 现 被 试 能 够 较 好 地 完成 迫 选任 务 , 表现 


不 同类 型 迫 选 对 


机 组 合 的 目标 词 和 跨 界 
音 统计 学 习 任务 的 结果 
4.1 统计 学 习 效 应 

经 典 的 统计 学 习作 


选项 间 转 换 概率 的 差异 确 
以 音节 为 单位 编制 的 人 工 语言 发 现 被 试 在 实验 一 
词 的 偏好 。 结 合 


o 


F 务 为 了 验证 个 体能 否 仅 依靠 音节 间 的 转换 概率 来 实现 语 流 切 分 ， 通 


常 只 选 


(Saffran et al., 1996; Wang & Saffran, 2014) 来 合成 人 工 语言 。 


Rp BZ 
SES Hn] 


计 学 习 或 词 切 分 , 较 少 


的 在 于 考察 转换 概率 高 低 是 否 会 影响 被 试 


门 设置 了 不 同 长 度 的 目 
统计 学 习 效应 ; 同时 ， 


被 试 的 迫 选 正确 率 。 实 验 二 中 , 我 们 通过 


所 表现 出 的 学 习 效应 3 


非 来 自 于 我 们 随 


个 实验 结果 ， 说 明 转 换 概率 能 够 独立 于 词 频 影响 语 


两 音节 词 (Mirman et al., 2008; Estes et al., 2015; Gomez et al., 2017) 或 三 音节 词 


但 近年 来 ， 一 些 学 者 提出 ， 


为 了 更 好 地 贴近 


然 语 


言 中 词 长 


\ 等 的 情况 CSaffran & Kirkham, 2018; Frost et al., 2020)， 同 


时 避免 韵律 期 待 效 应 (Hoch et al, 2013 )， 应 该 使 用 长 度 不 等 的 词语 合成 实验 材料 〈 于 文 勃 


等 ,2021b)。 在 实验 一 中 我 们 发 现 被 试 在 所 有 迫 选 试 次 下 的 正确 


££, 


著 高 于 随机 水 平 ， 达 到 


率 显 


了 0.58， 仍 旧 表 现 出 了 学 习 效 应 ， 与 以 往 研究 结果 一 致 (Estes et al., 2015; Palmer & Mattys, 


2016; Gómez et al., 2017; PFXP, 2021b0, 说明 即 使 在 较为 复杂 的 语言 环境 下 ,个 体 仍旧 


可 以 通过 追踪 语言 内 部 的 概率 信 


i 


现 被 试 在 转换 概率 和 词 频 差异 较 大 的 迫 选 对 
而 在 差异 较 小 的 迫 选 对 中 正确 率 较 低 , 甚至 和 


释 统计 学 习 效 应 的 合理 性 。 如 表 1 和 图 A 所 示 ， 我 们 采用 


WAEN. HEEF ERR, 
4.2 转换 概率 的 独立 效应 


AG 


统计 学 习 的 理论 源 来 自 于 Harris (1954, 1955) 对 自然 口语 中 语素 分 布 规律 的 归 


者 认为 个 体 可 以 通过 发 现 程序 习 得 语言 或 切 分 语 流 , 而 发 现 程序 的 关键 就 是 对 语 流 


究 为 统计 学 习 的 记忆 模型 理 


息 实 现 词语 切 分 ,实验 一 的 设计 更 进一步 地 验证 记忆 模型 在 
了 六 类 词语 组 成 迫 选 对 ， 结 果 发 

正确 率 较 高 (如 三 音节 目标 词 和 非 词 迫 选 对 )， 
随机 水 平 差异 不 显著 (如 两 音节 跨 界 词 和 两 音 


论 提供 了 更 精细 的 实验 证 据 。 


2 


a 


内 ， 作 
的 统计 


信息 进行 加 工 。 虽 然 词 频 和 转换 概率 都 可 以 被 看 成 概率 信息 , 但 是 它们 二 者 有 着 本 质 的 区 别 。 


个 将 ANE 


对 于 高 转换 概率 的 音节 组 合 ， 


前 


节 可 以 预测 后 一 


H H 


出 现在 语言 环境 中 ， 所 以 转换 概率 更 能 够 作为 判 
目标 词 和 跨 界 词 的 迫 选 中 , 两 音节 条 件 
中 等 程度 ， 但 单 样本 工 检验 的 结果 显示 被 试 的 三 音节 迫 ; 
显著 ,这 说 明 在 这 种 条 件 下 已 经 没有 了 学 习 效应 ， 被 试 
词 的 区 别 ， 相 应 的 ， 在 两 音节 迫 选任 务 
种 迫 选 类 型 下 被 试 能 够 很 好 地 区 分 目 
I 后 ， 音 节 间 的 转换 概率 仍 | 


词 频 被 探 上 


组 合 来 说 , 它们 的 转换 概率 可 能 3 


不 高 ， 即 前 一 个 音节 也 可 能 


节 的 出 现 , 但 对 于 高 频次 的 音节 


和 其 他 音节 组 成 词 ,并且 多 次 


断 语 流 


mi 


词 边 界 的 因 


— 3ndb A 


素 。 本 研究 中 ， 虽 然 在 


是 边缘 显著 高 于 


二 百 NA 


Jc IER 


ANY 


件 , 而 且 效应 量 也 未 达到 
1% (0.53) 与 随机 水 平 差异 不 


TJ 


辨 三 音节 目标 词 和 三 音节 跨 界 


学 习 效 应 仍 | 


标 词 和 跨 界 词 。 因 


日 稳定 


此 从 被 试 的 学 习 效 果 来 看 可 以 认为 在 


日 能 够 影响 语音 统计 学 习 效应 。 


(正确 率 达 到 0.61)， 说 明 在 这 


Endress 和 Mehler (2009) 在 人 工 语言 中 设置 了 “幽灵 词 ” 这 些 词 虽 然 没 有 以 音节 组 合 


的 形式 出 现 过 , 但 是 音节 间 的 转换 概率 和 目标 词 相 同 , 实验 结果 显示 被 试 对 幽灵 词 和 目 


标 词 


的 迫 选 正确 率 与 随机 水 3 


Poulin-Charronnat, 2012 )。 统 计 学 习 
缺少 明确 的 词 间 边 界 ， 因 


语料库 4 中 “there is” 和 “there are” ÆA J iH H 


口语 语 流 


PA 


随后 才 是 频次 等 信 


“差异 不 显著 , 但 被 试 对 幽灵 词 的 喜好 程度 高 于 跨 界 词 。 这 一 结果 说 
明 被 试 首先 是 以 转换 概率 作为 词语 切 分 和 存储 的 标准 


息 CPerruchet & 


FRR ROUTE HE A 


E 自 然 语 言 中 也 可 以 找到 证 据 。 


此 音节 间 的 统计 信息 对 于 词 切 分 尤为 关键 。 在 英语 


口语 


8 现 的 频次 高 达 458.6 和 433.82， 二 者 都 


^ 数据 来 源 : British National Corpus Online service, http://bncweb.lancs.ac.uk 
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是 高 频 结 构 ; (A “there” JA Hh “is” AY AY 883 


”具备 很 高 的 频次 ， 但 由 于 转换 概率 不 高 ， 所 以 更 可 能 被 切 分 成 两 个 单词 而 非 


不 高 5， 即 音节 间 的 转换 概率 不 高 。 虽 然 “there 


两 个 词 内 音节 。 
4.3 研究 启示 

本 研究 结果 有 助 于 思考 语言 使 用 视角 下 的 汉语 词 边界 问题 。 从 语言 学 4 
是 能 够 独立 运用 的 最 小 音义 结合 体 , 它 不 仅 是 个 体 在 头脑 


子 过 程 中 不 可 再 拆 分 的 结构 。 在 英语 中 ,语言 学 意义 上 的 词 和 个 体 头 脑 


个 单词 的 


9 度 看 ， 词 的 定义 
存储 的 基本 单位 , 还 是 在 构造 句 


的 词 概 念 一 一 对 应 ， 


如 a，apply，red 既是 从 语法 


普通 话 中 ， 在 语法 的 界定 


V 


语词 频 信息 ， 就 包括 了 “打球 和“ 吃饭 ” 


语 


9 度 划 分 的 词 也 是 语言 使 有 

; “打球 ”、 “心软 ” 的 结构 是 短语 或 i 

说 这 些 结构 在 心理 上 是 词 6， 例 如 Cai 等 人 (2010) 通过 建立 电视 连续 剧 字 幕 语 料 库 统 计 汉 
口 


这 些 词组 结构 的 词 频数 据 。 在 


日 角度 最 直接 感受 到 的 词 结构 。 汉 语 


司 组 ， 但 对 普通 话 母 语 者 来 


音节 “ 打 ” 后 还 


可 能 出 现 音节 “Hy, € Wr ". “中 ”、 AR 6 电话 ” 等 连 谓 、 动 补 和 动 宾 等 结构 ， 事实 上 ， “ 打 


两 个 音节 间 的 转换 概率 3 
音节 的 预测 性 (转换 概率 ) 能 够 影响 大 脑 对 词 


研究 的 结果 能 够 为 汉语 词 边界 划分 在 语言 学 到 


不 高 , EIC AR AST 


究 发 现 口语 加 工 中 前 一 个 音节 对 后 一 个 


边界 的 识别 ,那么 在 类 似 结构 中 个 体 很 可 能 只 


将 “ 打 ” 切 分 出 来 作为 一 个 结构 单位 加 工 ?， 而 不 是 将 “打球 ”作为 一 个 整体 进行 加 工 。 


5 结论 


E 论 和 语言 使 用 视角 


+ 


下 的 不 统一 问题 提供 参考 。 


研究 发 现 ， 当 词 频 固定 时 ， 转 换 概率 仍旧 能 够 影响 统计 学 习 的 效应 ， 被 试 仍旧 可 以 识 
别 出 高 转换 概率 的 目标 词 或 跨 界 词 , 说 明 转换 概率 对 统计 学 习 的 影响 在 一 定 程度 上 独立 于 词 


频 。 
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The independent effect of transitional probability 


on verbal statistical learning 


Wenbo Yu!, Tianlin Wang’, Hetong Qi!, Dandan Liang? 


1.School of Chinese Language and Culture, Nanjing Normal University 
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3.Interdisciplinary Research Center for Linguistic Science, University of Science and 
Technology of China 


Abstract: In a typical SL task, participants are first exposed to a nonsensical artificial language 
for 5-10 mins and then asked to finish a 2 alternative forced choice task (ZAFC). If the accuracy 
across participants is higher than chance level, it is assumed that learning has occurred. However, 
studies have also shown that factors other than TPs, such as word token frequency, also impact SL 
performance in such tasks. To date, these factors as well as their interactive effects remain under 
studied. 

In this experiment we aimed to investigate whether TPs affect SL learning performance when 
controlling for target words' and partwords' token frequencies. In doing so, we created the 
artificial language by randomizing the order of two trisyllabic words and two disyllabic words. 
During the 2AFC task, three types of items (target word, partword, and nonword) were paired 
together, with two items in equal length in each trial. There were 24 trials in the test. 40 native 
Mandarin monolinguals participated in the experiment; they first listened to the artificial language 


14 


for 5mins and then finished the 2AFC task. 

To investigate the independent effect of TP in SL, we subset the data by word length and 
found that participants' accuracy choosing trisyllabic target words over partwords was marginally 
lower than their choosing disyllabic target words over partword, which suggests that disyllabic 
words confer advantage in SL for this group of participants. In addition, participants’ accuracy in 
choosing trisyllabic partwords over nonwords was significantly higher than that of disyllabic 
target partwords over nonwords. 

A series of results across two behavior experiments highlight the unique contribution from 
TPs alone, since accuracy was assessed by controlling for word token frequency and word length. 
Thus, the present study suggests that TP exerts effect on verbal SL performance independent of 
word token frequency. 


Key words: transitional probability; tokens; statistical learning; 2-alternative forced choice task 


